Match con datos

Jorge Mario Estrada Alvarez MSc. PhD(c)

Union izquierda y derecha

left_join(x = ,  #dataframe a adicionarle
          y = ,  # dataframe con info a agregar
          by = ) # identificador de ambas bases

Fuente: https://github.com/gadenbuie/tidyexplain/tree/main/images
right_join(x = ,  #dataframe a adicionarle
          y = ,  # dataframe con info a agregar
          by = ) # identificador de ambas bases

Uniones interna y completa

inner_join(x = ,  #dataframe a adicionarle
           y = ,  # dataframe con info a agregar
           by = ) # identificador de ambas bases

Fuente: https://github.com/gadenbuie/tidyexplain/tree/main/images
full_join(x = ,  #dataframe a adicionarle
          y = ,  # dataframe con info a agregar
          by = ) # identificador de ambas bases

Semi-union (union filtrada) y Anti-union

semi_join(x = ,  #dataframe a adicionarle
           y = ,  # dataframe con info a agregar
           by = ) # identificador de ambas bases

Fuente: https://github.com/gadenbuie/tidyexplain/tree/main/images
anti_join(x = ,  #dataframe a adicionarle
          y = ,  # dataframe con info a agregar
          by = ) # identificador de ambas bases

ejemplo de uso : left_join()

# A tibble: 6 × 10
  location_name data_date  submitted_date Province District `malaria_rdt_0-4`
  <chr>         <date>     <date>         <chr>    <chr>                <int>
1 Facility 1    2020-08-11 2020-08-12     North    Spring                  11
2 Facility 2    2020-08-11 2020-08-12     North    Bolo                    11
3 Facility 3    2020-08-11 2020-08-12     North    Dingo                    8
4 Facility 4    2020-08-11 2020-08-12     North    Bolo                    16
5 Facility 5    2020-08-11 2020-08-12     North    Bolo                     9
6 Facility 6    2020-08-11 2020-08-12     North    Dingo                    3
# ℹ 4 more variables: `malaria_rdt_5-14` <int>, malaria_rdt_15 <int>,
#   malaria_tot <int>, newid <int>
  • Reto 1: Crear una tabla resumen (dataframe) llamada malaria_distr que contenga el total de casos de malaria por distrito.

Posteriormente, usamos la siguiente función con el dataframe del reto 1 y el dataframe incluido denominado pob_malaria.rds

left_join(x = ,
          y = ,
          by = )

  • Reto 2: Con el dataframe resultado del uso de la función lef_join() utilizado crear la incidencia de malaria por distrito y almacenarla en una variable denominada inc_malaria

Gracias